Python - pandasのdate_range
·1 分
この投稿は、pandasライブラリ内で日付を自動的に生成できるdate_range()関数について説明するために作成されました。
データのインデックスに日付を一つ一つ入力する代わりに、pandasのdate_range()を活用すると、値が多い時に便利です。
date_range()は以下のように使用します。
>>> pd.date_range(start='日付', end='日付', freq='周期')
例を挙げて説明します。
>>> pd.date_range(start='2024/01/01', end='2024/01/07')
DatetimeIndex(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04',
'2024-01-05', '2024-01-06', '2024-01-07'],
dtype='datetime64[ns]', freq='D')
出力された結果として、開始日である'2024/01/01’から終了日である'2024/01/07’までが出力されたことが確認できます。
もう一つの例を見てみましょう。
>>> pd.date_range(start='2024-01-01 08:00', periods = 4, freq = 'H')
DatetimeIndex(['2024-01-01 08:00:00', '2024-01-01 09:00:00',
'2024-01-01 10:00:00', '2024-01-01 11:00:00'],
dtype='datetime64[ns]', freq='H')
結果を見ると、開始日である'2024-01-01’の08時から周期である’H’(時間単位)を基にした4つの結果が出たことが確認できます。
freq(周期)を設定する場合、以下のリンク内のOffset aliasesを参照すると、様々な形で出力が可能です。
参照: https://pandas.pydata.org/docs/user_guide/timeseries.html#timeseries-offset-aliases